Rank | Count | Beginning |
---|---|---|
8826 | 767 | ეს |
21379 | 636 | როგორც |
1095 | 612 | ამ |
17028 | 390 | მისი |
1856 | 339 | ამის |
27987 | 330 | ჩვენ |
15867 | 286 | მე |
23653 | 230 | საქართველოს |
11169 | 225 | თუ |
17113 | 222 | მისივე |
20905 | 222 | რაც |
11358 | 204 | თუმცა, |
15144 | 195 | მან |
12672 | 167 | ის |
14698 | 164 | მათ |
8064 | 138 | დღეს |
20511 | 137 | რა |
7023 | 135 | და |
3535 | 131 | ასევე |
26828 | 125 | შეგახსენებთ, |
3087 | 121 | არ |
11359 | 120 | თუმცა |
14507 | 117 | მაგრამ |
12795 | 116 | ისინი |
4738 | 107 | ახლა |
24834 | 107 | სწორედ |
6202 | 104 | გარდა |
11977 | 103 | იგი |
15546 | 101 | მას |
1269 | 100 | ამასთან, |
In the next four subsections show the most frequent sentence beginnings consisting of N words, N=1, 2, 3, 4. In this subsection we start with N=1.
The most frequent word-N-grams at the beginning of sentences give some insight into sentence composition.
Especially for N=1, we only need a small corpus to identify the most frequent sentence beginnings.
select substring_index(sentence, ' ', 1) as beg, count(*) as cnt from sentences group by substring_index(sentence, ' ', 1) order by cnt desc limit 50;
4.3.1.2 Most Frequent Sentence Beginnings II
4.3.1.3 Most Frequent Sentence Beginnings III
4.3.1.4 Most Frequent Sentence Beginnings IV
4.3.1.1 Most Frequent Sentence Endings I
4.3.1.2 Most Frequent Sentence Endings II
4.3.1.3 Most Frequent Sentence Endings III
4.3.1.4 Most Frequent Sentence Endings IV